home *** CD-ROM | disk | FTP | other *** search
/ Collection of Internet / Collection of Internet.iso / infosrvr / dev / www_talk.930 / 000528_connolly@pixel.convex.com _Fri Jan 8 20:42:44 1993.msg < prev    next >
Internet Message Format  |  1994-01-24  |  6KB

  1. Return-Path: <connolly@pixel.convex.com>
  2. Received: from dxmint.cern.ch by  nxoc01.cern.ch  (NeXT-1.0 (From Sendmail 5.52)/NeXT-2.0)
  3.     id AA02102; Fri, 8 Jan 93 20:42:44 MET
  4. Received: by dxmint.cern.ch (5.65/DEC-Ultrix/4.3)
  5.     id AA01873; Fri, 8 Jan 1993 20:57:42 +0100
  6. Received: from pixel.convex.com by convex.convex.com (5.64/1.35)
  7.     id AA06326; Fri, 8 Jan 93 13:57:34 -0600
  8. Received: from localhost by pixel.convex.com (5.64/1.28)
  9.     id AA07944; Fri, 8 Jan 93 13:57:33 -0600
  10. Message-Id: <9301081957.AA07944@pixel.convex.com>
  11. To: timbl@nxoc01.cern.ch
  12. Cc: www-talk@nxoc01.cern.ch
  13. Subject: Re: new HTML spec, sample implementation 
  14. In-Reply-To: Your message of "Fri, 08 Jan 93 16:14:15 +0100."
  15.              <9301081514.AA02989@www3.cern.ch> 
  16. Date: Fri, 08 Jan 93 13:57:32 CST
  17. From: Dan Connolly <connolly@pixel.convex.com>
  18.  
  19.  
  20. [Tim: could you limit your lines to 72 chars like the
  21. rest of the world? It's a pain to deal with lines that
  22. have been split by wierd MTA's.]
  23.  
  24. >    The spec available as:
  25. >    http://info.cern.ch/hypertext/WWW/MarkUp/Connolly/930106/HTML.html
  26. >    
  27. >    The older versions are all availavle as well.. link to a list of them
  28. >    from the Markup futures page.
  29.  
  30. Unfortunately, the most recent version of the spec is the hardest to
  31. find. I'd like most of the pointers to the older versions to be
  32. updated. And I'd like to see the instructions to data providers
  33. brought up to date. Currently, most of the documentation (especially
  34. the exmples) doesn't say to quote HREFs, for example.
  35.  
  36. >>WHERE DO WE GO FROM HERE?
  37. >>  * registering HTML with the IANA
  38. >>  much of the spec is "by example," that is, tolerated.html
  39. >>  demonstrates the tolerated techniques much better than
  40. >>  it explains them.
  41. >
  42. >I agree that this compilicates it.  The explanation is in large part in
  43. >files which are likely to be unreadable by many browers!
  44.  
  45. The "explanation" is nothing more than an implementors guide. I
  46. thought that implementors would get more from example HTML code
  47. than any prose I could come up with in a reasonable amount of
  48. time. I agree that much is needed in the way of real documentation.
  49.  
  50. >We would then generate a paper document out of all the hypertext and the .txt
  51. >files, and the document generator won't fall over!
  52. >
  53. >I would also like to see a node on each tag.  I found from user comments that 
  54. >the current explanations of HTML or just not good enough. We need some stuff on
  55. >the side of the spec explaining what each tag is actually FOR, with an example
  56. >of each, acessesed from a reference section.  Maybe that can wiat till after  
  57. >IANA registration, though.
  58.  
  59. My point exactly: for the IANA, all we need is a correct spec,
  60. not necessarily an easy to use spec. That's what I meant
  61. by "workable."
  62.  
  63. I don't have time to do a good job explaining how to use HTML.
  64. I just wanted to explore all the technical issues and clear
  65. them up.
  66.  
  67. >>  * bringing implementations into compliance
  68. >
  69. >It sounds as though (1) HTML.c should be turned into a structued hypertext
  70. >object built on top of -- in the line mode case only -- the HText.c object.
  71.  
  72. Agreed.
  73.  
  74. >I feel that the SGML parsing object should create the textobject, because
  75. >one SGML file could cause many displayable objects to be created -- in the  
  76. >future at least.  Theerfore, it is not enough to pass the SGML object the ID
  77. >of an already-created text object. Does that make sense?
  78.  
  79. At first it didn't, but upon reading it again, it's exactly what
  80. I had in mind.
  81.  
  82. >Otherwise I think our architecures are converging ... do you want to make
  83. >a new WWW/Library and I'll try it out?  I can release it in parallel with
  84. >the current one for a while for safety.
  85.  
  86. If I find time, I'd like to.
  87.  
  88. >    Are the ISO latin 1 characters in  
  89. >http://info.cern.ch/hypertext/WWW/MarkUp/Connolly/921203/ISOlat1.html
  90. >    in order? it would be useful to have their character code there.
  91.  
  92. This question seems to confuse two things: the ISOlat1 entity
  93. set, and the ISO Latin 1 character set. The first is mapping
  94. of names to glyphs, and the second is a mapping from the numbers
  95. 128-255 to glyphs. I think they're in alphabetical order
  96. by name, but not in order by the ISO Latin 1 character set.
  97.  
  98. >I would have thought the SGML engine ought to be able to resolve all entities.
  99.  
  100. The SGML parser is responsible for resolving text entities. There
  101. are also external data entites, which are ultimately resolved by
  102. the application. I was leaning towards treating ISO latin characters
  103. as external data entities, rather than text entities. If we treat
  104. ISOlatin characters as SGML characters, we eliminate the need for entity
  105. references in HTML altogether (we could still support ö, < etc.
  106. however)
  107.  
  108. Here is the crux of the matter:
  109.  
  110. >The communication between it and the text object would have to be defined in  
  111. >terms of a particular character set
  112.  
  113. And this character set is stated in the SGML declaration at
  114. the top of html.dtd.
  115.  
  116. If we define HTML in terms of the
  117. full ISO Latin 1 character set, then the parser can deal with
  118. ö, and pass it to the text object as a data character, just
  119. like an 'A' character. For X displays using iso8559 fonts, that's
  120. cool.
  121.  
  122. But on a PC or a Mac, that means the text object will have to
  123. scan all the data it gets and convert the Latin1 encoding to
  124. it's own. Yuck.
  125.  
  126. >... and perhaps if there is more than one  
  127. >contender the SGML engine could have a compilation option.
  128.  
  129. Hmmm... One might argue that as long as we support conversion inside
  130. the SGML parser for EBCDIC machines, we might as well support PC and
  131. Mac character sets while we're at it.
  132.  
  133. My original plan was that the core of wwwlib would support
  134. ASCII only, and application developers would deal with latin
  135. characters by name. Moving Latin-1 characters into the core
  136. complicates it somewhat, and I'm still against that.
  137.  
  138. Dan
  139.